Testes de Hipóteses

Prova Didática: Seleção professor substituto

Carolina Musso

Departamento de Estatística - UnB

Exemplo fictício

  • Imagine existe uma forma de medir a ansiedade com um número A (\(-\infty, +\infty\)).

  • Quanto mais negativo, mais calma e quanto mais positivos mais ansiosa a pessoa está.

  • Um censo no DF nos anos 90:

    • A média de ansiedade é de 0 “ansiogramas” com um desvio padrão de 1 “ansiograma”.

    • Ou seja \(A_{DF} \sim N(\mu_{DF_0} = 0, \sigma^2_{DF_0} = 1)\)

Resultado censo

Motivação

  • Desconfiamos que esse nível de ansiedade aumentou.

    • Em 2024, amostra aleatória de mil pessoas.
  • \(\bar{x}\) = 2,32 ansiogramas, e a variância não mudou.

    • Será que essa média é mesmo maior que meu valor de referência (média 0)?

Ou será

Qual a intuição do teste de hipótese

  • Queremos tirar conclusões sem ter acesso a toda a informação.
    • Nunca terei certeza
    • Qual a chance de, ao acaso, eu ter selecionado justamente as pessoas mais ansiosas?
    • Tirar uma conclusão sabendo essa “incerteza”.

Formulação de um teste de hipótese

  • Hipótese Nula (\(H_0\)): É a hipótese inicial, frequentemente assumindo que não há efeito ou diferença significativa.

  • Hipótese Alternativa (\(H_1\) ou \(H_a\)): É a hipótese que se quer testar, indicando a presença de um efeito ou diferença significativa.

\(H_0: \mu_{DF_1} = \mu_{DF_0} = 0\)

\(H_1: \mu_{DF_1} > \mu_{DF_0} = 0\)

Como testamos essa hipótese?

  • Temos que estabelecer um critério.

  • O quanto estamos dispostos a “errar”?

    • Dado que \(H_0\) é verdadeira.
  • Nível de significância \(\alpha\)

  • \(\alpha=0.05\) é um dos mais comuns.

Nível de significância de 5%.

  • Parece uma chance baixa o suficiente?

E se a média da população tiver mesmo mudado?

  • Faz mais sentido, certo?

Tipos de Erro que posso cometer

Rejeita H0 Não-rejeita H0
H0 verd. Erro tipo I Correto!
H0 falsa Correto! Erro tipo II

Na prática

Precisaremos calcular algum valor

  • Dificilmente será: \(A \sim N(\mu_{0} = 0, \sigma^2_{0} = 1)\)

    • Temos que padronizar!

    • Calcular alguma estatística.

O que já sabemos?

  • Distribuição amostral da média \(\bar{x} \sim N(\mu, \frac{\sigma^2}{n})\)
  • Uma amostra de uma distribuição normal, (ou grande o suficiente), e que eu conheço a variância populacional:

Para padronizar

\[Z = \frac{(\bar{x} - \mu_{nula})}{\frac{\sigma}{\sqrt{n}}} \sim N(0,1)\]

  • Para tirar a conclusão

    • Olhar na Tabela
    • Usar algum software

Recaptulando

“Receita”

  • \(\mu_0, \sigma^2, \bar{x}\)
  • Fixe a probabilidade
    • Probabilidade de cometer o erro de tipo I :

      • 5% (0.05) por exemplo
  • Elabore as hipóteses

\(H_0: \mu_{1} = \mu_0\)

\(H_1: \mu_{1} > \mu_0\)

“Receita”

  • Calcule a estatística do teste

\[Z = \frac{(\bar{x} - \mu_{nula})}{\frac{\sigma}{\sqrt{n}}} \sim N(0,1)\]

  • Baseado em \(\alpha\)

    • Defina a Região Crítica
    • Calcule o p-valor
  • Tire a conclusão

    • Rejeitar ou Não Rejeitar a hipótese nula

Região Crítica

Região Crítica

\[\alpha = 0.05\]

Veja se o valor está na região crítica

p-valor

  • Idéia inversa
  • Suponha \(Z = 2,02\)

p-valor

`

  • Se p-valor for menor que \(\alpha\), rejeite \(H_0\)

Voltando ao nosso exemplo da ansiedade

  • Dessa vez, temos os dados da população de São Paulo em 1990.

    • Asiedade \(A_{SP} \sim N(2,4)\)
  • Em 2023, medimos a ansiedade de 50 pessoas e a média foi de 2,5 ansiogramas.

Teste de hipótese Z

  • Hipóteses

\(H_0: \mu_{SP_1} = \mu_{SP_0}= 2\)

\(H_1: \mu_{SP_1} > \mu_{SP_0} = 2\)

  • Significância

\(\alpha=0.05\)

  • Calcular a estatística.

\(Z \sim N(0,1)\)

Calculando a Estatística Z

\[Z = \frac{2,5 - 2}{\frac{2}{\sqrt(50)}} = 1.77 \]

Construa a região crítica

Tire a conclusão

\(Z = 1.77 > 1.645\) Está na região crítica!

  • Rejeita-se a Hipótese Nula (\(H_0\)). Há evidencias que a média de ansiedade na população do DF aumentou.

OU … Calcule o p-valor

  • Olhe na tabela, qual a probabilidade acumulada à direta de 1.77?

Que teste fizemos?

  • Teste para uma amostra:

    • De uma população com distriuição normal

    • Ou uma amostra suficientemente grande

  • Variância conhecia

  • Unilateral

Como seria o bilaterial?

\[ H_0: \mu_{1} = 0\\ H_{1}: \mu_{1} \neq 0 \]

Para a próxima aula

  • Leia sobre o teste de proporção. Tente relacionar com a média.
  • Outros tipos de teste

Você sabia?

“p-hacking”

Para aprofundamento

Bibliografia básica:

Bibliografia mais “lúdica”

BARBETTA, P. A. Estatı́stica aplicada às ciências sociais. [s.l.] Ed. UFSC, 2008.
LAPPONI, J. C. Estatı́stica usando excel. [s.l.] Elsevier Brasil, 2004.
MORETTIN, P. A.; BUSSAB, W. O. Estatı́stica básica. [s.l.] Saraiva Educação SA, 2017.